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От личности к искусственному интеллекту 


В статье рассматриваются вопросы реализации некоторых функций искусственного интеллекта и 
искусственной личности на базе бионического подхода. Показана реализация функций восприятия, 
обработки и распознавания визуальной информации по аналогии с процессами, протекающими 
в зрительной системе человека как личности — биологического мира. Сформулированы гипотезы 
«О приведении распознаваемых изображений к одному размеру в области фовеа» и «О механизме 
распознавания образов в высших слоях неокортекса мозга человека». На базе рабочих гипотез созданы и 
реализованы модель и нейронная сеть сенсорного органа зрительной системы человека. 


Введение 


Анализ проблематики исследований в области искусственного интеллекта (ИИ) 
показывает, что в настоящее время, с одной стороны, идет интенсивная дифферен- 
циация ее предметных областей и, с другой стороны, происходит своеобразная 
интеграция исследований в рамках поиска возможностей построения общей теории. 
Интеграция исследований диктуется необходимостью объединения всего комплекса 
исследований в области искусственного интеллекта в единое целое на основе общей 
универсальной концепции или идеи, восходящей к своему функциональному про- 
тотипу: думающей (мыслящей) и действующей (физически) личности — человеку [1]. 

Одна из предметных областей ИИ - распознавание образов. Создание систем 
распознавания образов с элементами искусственного интеллекта является сложной 
теоретической и технической проблемой. Необходимость в таком распознавании 
возникает в самых разных областях. 

Традиционно задачи распознавания образов включают в круг задач искусствен- 
ного интеллекта, где выделяют два основных направления: 

первое — развитие теории и методов построения программных комплексов, пред- 
назначенных для решения отдельных задач распознавания в прикладных целях — 
классический подход; 

второе — изучение механизмов распознавания, которыми обладают живые суще- 
ства, с целью их воспроизведения в системах распознавания — бионический подход. 

Целью данной работы является рассмотрение, в рамках бионического подхода, 
функций восприятия и распознавания визуальной информации биологической личностью — 
человеком с последующей их реализацией в системах искусственного интеллекта. 

Для обеспечения развития познавательного процесса в замкнутых системах необ- 
ходимо выйти за рамки системы сложившихся понятий и конструктивных элементов. 
Основным требованием, которое можно было бы предъявить конструкту, выражающему 
этот метавзгляд, должна быть его «естественная искусственность» и его «искусственная 
естественность» [2], полнота взгляда и взаимодействия с реальностью. 
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Особую сторону концептуального объекта составляет уровень его возможностей 
реализовывать результаты своей интеллектуальной деятельности. Речь идет о том, 
разделены ли в конструкте умственные (мыслительные) и физические (двигательные) 
функции. Другими словами, достаточно ли он определен в смысле теста А. Тьюринга для 
ответа на вопрос о его способности к мышлению, или ему еще требуется тест о его 
достаточной физической (двигательной) роботоспособности. По отношению к концеп- 
туальному конструкту естественно поставить вопрос о его антропоморфности. С одной 
стороны, он должен быть антропоморфичен, как идеал, демонстрирующий неограничен- 
ность совершенствования создаваемых человеком интеллектуальных искусственных 
объектов законами природы. С другой стороны, он не должен быть антропоморфичен 
как реальный объект с ограниченными возможностями в условиях достигнутого к 
настоящему времени уровня развития человеческой цивилизации [3], [4]. 

По-видимому, истина должна быть где-то посередине, оптимально отражая кон- 
структивные и познавательные возможности человека-творца, работающего в конкрет- 
ных материальных и духовных условиях природы и общества. 

Таким образом, наиболее приемлемым видом концептуального конструкта, в наи- 
большей мере разрешающего проблему интеллекта, является конструкт, обладающий 
чувствительными сенсорами восприятия, чувствительными органами манипулиро- 
вания и движения, системой и метасистемой управления, т.е. образование, наиболее 
близкое к современному человеку разумному (Вото зартепз). Такой конструкт получил 
название «искусственной личности». 

Искусственная личность есть идеальный конструкт, способный к поглощению 
всего многообразия процессов преобразования информации, антропоморфно отображаю- 
щий деятельность своего прототипа — современного человека разумного [2]. 

Производная искусственной личности по умственным возможностям дает кон- 
цепт интеллекта, а производная по физическим возможностям -— денотат интеллекта. 

Если конструировать искусственную личность как реальную машину, способную 
преобразовывать не только информацию, но и выполнять вещественные операции в 
окружающем мире, то она может быть реализована как робот с высокоразвитым интел- 
лектом, имитирующий биологическую, живую машину — человека. В этом случае кон- 
структ может быть назван «антропоморфной искусственной личностью» с соответ- 
ствующими естественными требованиями к нему: наличия сенсорных органов, аппарата 
движения и опоры, наличия развитого аппарата переработки информации, естествен- 
ности движений и поведения. 

Если же конструировать искусственную личность как виртуальную машину, 
способную перерабатывать только информацию, то в этом случае конструкт может 
быть назван «виртуальной искусственной личностью-роботом». В отличие от антро- 
поморфной искусственной личности, виртуальная все свои органы и элементы только 
имитирует в форме изображений, однако процессы переработки информации по их 
результативности вполне реальны и правдоподобны [1]. 

Таким образом, машина может быть интеллектуальной только в случае, если бу- 
дет наделена основными параметрами и системами, подобными системам человека. 

В данной работе мы рассмотрим функции восприятия, обработки и распоз- 
навания информации, воспринимаемой зрительной системой человека. 

При бионическом подходе к решению задачи восприятия и распознавания 
образов взоры исследователей обращаются к зрительной системе человека. Тем 
более что 80 — 90 % воспринимаемой информации поступает через глаза. 
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Сенсорный орган зрительной системы человека 


Глаз — сенсорный орган зрительной системы человека состоит из глазного яблока 
и зрительного нерва (рис. 1). 

Глазное яблоко имеет диаметр около 24 мм и форму почти правильного шара, 
но с несколько более выпуклой передней частью. 
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Рисунок 1 — Схема глаза человека 


Вокруг каждого глазного яблока находится шесть мышц. Глаза двигаются наруж- 
ной и внутренней прямой мышцей - влево, вправо; нижней и верхней прямой мыш- 
цей — вниз, вверх; косые мышцы — вращают глаз. Но на этом работа глазодвига- 
тельных мышц не заканчивается. 30-летние исследования У. Бейтса доказали, что 
прямые мышцы глаза могут укорачивать глазное яблоко вдоль оптической оси глаза, 
таким образом приближая хрусталик к сетчатке, а косые — могу сжимать глаз и ото- 
двигать хрусталик от сетчатки. Роговица имеет радиус кривизны 6,82 мм и выпол- 
няет роль собирающей линзы. 

Между роговицей и хрусталиком расположена радужная оболочка. Радужная 
оболочка глаза регулирует силу светового потока таким образом, что на рецепторы 
глаза поступает почти постоянный световой поток. Пространство, образованное между 
роговицей и радужкой, называется передней камерой. Она заполнена внутриглазной 
жидкостью. 

Через хрусталик изображение проецируется на сетчатку глаза (ретину). Благо- 
даря аккомодации — эластичности хрусталика и действию глазной мышцы, хрусталик 
приобретает форму, обеспечивающую резкую проекцию изображения на светочув- 
ствительные преобразователи (рецепторы), расположенные в сетчатке глаза. 

Процесс аккомодации состоит в изменении оптической силы (рефракции) глаза. 
Это достигается изменением радиуса кривизны хрусталика в результате действия коль- 
цеобразной мышцы. При расслабленной мышще связки натягивают мешочек хруста- 
лика и кривизна его поверхностей становится наименьшей. В этом случае на сетчатке 
получается резкое изображение удаленных предметов. Фокусное расстояние глаза 
взрослого человека может изменяться от 18,7 до 20,7 мм, что обеспечивает фокусировку 
как на дальних, так и на ближних объектах. При максимальном сжатии мускульного 
кольца глаз отчетливо видит наиболее близкие предметы. Формирование изображения в 
основном осуществляется роговицей вместе с хрусталиком, которые в комбинации 
имеют фокусное расстояние около 20 мм. 

Сетчатка состоит из множества отдельных элементов — рецепторов, каждый 
из которых реагирует на световой поток независимо друг от друга. Глаз человека содер- 
жит светочувствительные элементы двух типов — колбочки и палочки. Распределение 
палочек и колбочек в сетчатке неравномерно: палочек больше на периферии, а кол- 
бочек — в центре. 
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В центре сетчатки имеется участок, содержащий только колбочки. Этот участок 
называется центральной ямкой (область фовеа). Разрешающая способность глаза 
здесь максимальна, причем колбочки центральной ямки непосредственно связаны с 
высшими нервными центрами, в то время как большинство рецепторов сетчатки не 
имеют «прямой» связи с мозгом. Можно полагать, что основная часть работы по извле- 
чению зрительной информации выполняется той частью рецепторов, которые лежат 
в середине сетчатки в области центральной ямки. 

Зрительный центр головного мозга находится в затылочной части головы, в ос- 
новании черепа. Основная часть нервных путей пересекается в передней части основания 
черепа. Мозг принимает информацию из правого и левого глаза. Затем она объеди- 
няется в единый образ. Как раз для пространственного зрения важно взаимодействие 
обоих глаз, чтобы глаза были направлены в одну точку. 
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Рисунок 2 — Схема проекции изображения в область фовеа 


Ранее была выдвинута гипотеза «О приведении распознаваемых изображений к 
одному размеру в области фовеа», реализация которой, на наш взгляд, подтверждается 
исследованиями офтальмологов. 

Рабочая гипотеза 1. Гипотеза о приведении распознаваемых изображений 
к одному размеру в области фовеа. Учитывая, что в системе глаз человека имеется 
только одна область (центральная ямка, фовеа), где разрешающая способность глаза 
максимальна, причем колбочки центральной ямки непосредственно связаны с высшими 
нервными центрами, можно предположить, что распознаваемый объект (объект, 
на котором сконцентрировано внимание, обращен взгляд), например «К'» или «К”» 
(рис. 1,2), сканируется саккадами— движениями глаз, осуществляя систематический 
отбор информации о форме, положении и размере объекта, проецируется в область 
фовеа с учетом этих параметров, затем в высших отделах мозга происходит анализ, 
синтез и сравнение с запомненными ранее объектами по уровню возбуждения нейронов, 
отражающих признаки и свойства этих объектов. 

Это относится к объектам разного размера, находящимся на одинаковом расстоя- 
нии от глаза. Если размер объекта большой и его проекция выходит за пределы области 
фовеа, то некоторая его часть, выходящая за пределы фовеа, будет видна не четко. 
При нормальном функционировании глаза этого не происходит, значит, проекция долж- 
на полностью проецироваться в область фовеа за счет изменения фокусного расстоя- 
ния. А размеры объектов могут определяться не размерами их проекций в области 
фовеа, а уровнем возбуждения соответствующих командных нейронов глазных мышц, 
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управляющих формой хрусталика’, или, по другим источникам, формой глазного яблокаг, 
что приводит к изменению фокусного расстояния лиизы — хрусталика в первом случае, 
а во втором - к изменению фокусного расстояния системы глаз. Кроме того, оцени- 
вание расстояния обоими глазами осуществляется за счет конвергенции глаз (состояния 
командных нейронов внутренних прямых глазных мыши). Так, при смотрении обоими гла- 
зами в одну и ту же точку А, как показано на рис. 3, необходимо некоторое мускульное 
‘усилие внутренних прямых глазных мышц для того, чтобы свести оба глаза внутрь. Гла- 
за расположены на некотором расстоянии друг от друга, и мы на опыте научаемся оце- 
нивать расстояние до точки А по мускульному усилию, необходимому для сведения (кон- 
вергенции) глаз. Для того чтобы увидеть ещё более близкую точку В, приходится 
употребить ещё большее мускульное усилие для сосредоточения обоих глаз в точке В. 


Угол конвергениии 


Рисунок 3 — Конвергенция глаз 
Таким образом, на рецепторное поле сетчатки глаза в область фовеа подается 
резкое изображение рассматриваемого объекта, при необходимости и его деталей. 
Информация о цвете, форме, положении, размере и пр. передается в зрительную кору 
головного мозга. 


В зрительной коре мозга более 50 % нейронов занято анализом информации, 
поступающей из области, соответствующей 10 % поля зрения, принадлежащего его цен- 
тральной части (центральной ямке), которая наиболее чувствительна к тонкой струк- 
туре и цвету изображения. В связи с этим зрительная система обладает возможностью 
переводить глаза с одной части поля зрения на другую, поскольку при любом фикси- 
рованном положении лишь небольшая часть поля зрения имеет высокое разрешение [1]. 

Действительно, у человека глаза все время находятся в движении, последова- 
тельно переходя с одного участка поля зрения на другой. Движение глаз слагается из 
скачков (саккад), которые обычно повторяются с частотой четыре — пять раз в секунду. 
Саккадическое движение происходит за счет активности наружных мышц глаз и, раз 
начавшись, продолжаются до заданного положения без поправок во время движения 
(баллистическое движение). В целом характер движения глаз отражает систематический 
отбор внешней информации, основанный на осмысленной интерпретации поступающих 
данных [5]. 


' По теории Г. Гельмгольца, при рассмотрении предметов на различных расстояниях оптические 
параметры хрусталика меняются цилиарной мышцей или, как утверждает некоторые офтальмологи, 
перемещением внутриглазной жидкости, что для нас никакого значения не имеет, т.к. и то и другое приводит 
к изменению фокусного расстояния. 

? Американский офтальмолог У. Бейтс на стыке ХХ — ХХ веков сделал открытие, что изображение в 
человеческом глазу строится за счет изменения длины самого глаза. 
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При появлении в поле зрения стимул-цели глаза совершают скачок, в результате 
которого сетчатки изменяют свое положение так, что стимул-цель проецируется на 
каждой из них в область фовеа. Если после выполнения саккады стимул-цель все же 
не попадает в область фовеа, то следует корректирующая саккада. При возникновении 
акустического сигнала в одной из точек внешнего пространства глаза совершают сак- 
каду и занимают такое положение, при котором направление на звук совпадает с на- 
правлением взора. При этом потенциально возможный зрительный образ источника 
звука будет проецироваться в область фовеа. При прикосновении к коже, например, 
груди глаза поворачиваются так, что линия взора направлена на место раздражения. 
При этом фовеа глаз совмещаются с точкой прикосновения. Произвольные саккады 
реализуются и при осмотре зрительной сцены. Выбор стимула, представленного на 
константном экране, который подлежит уточнению с использованием фовеа, означает 
возбуждение такого командного нейрона, который обеспечит совмещение выбранной 
цели с фовеа при учете исходного положения глаз [2]. 

По Е.Н. Соколову и В.А. Шмелеву в книге «Нейробионика» пишут: «Саккадические 
движения глаз принадлежат к широкому классу баллистических движений, которые 
не контролируются на участке выполнения движения. Обратная связь при выполне- 
нии этих движений вводится через внешнюю среду после завершения элемента движе- 
ния. Сходство с саккадическими движениями глаз обнаруживают саккадические движе- 
ния головы, а также целенаправленные движения рук» [3]. (Полагаю, что такой вид 
обратной связи характерен и для других функций головного мозга человека. Например, 
внутреннее или мысленное проговаривание читаемого текста, или внутреннее про- 
говаривание мечтаний и мысленных размышлений, составления планов, планирование 
действий и принятия решений.) 

Далее они пишут, что при появлении нового зрительного стимула, возникающие 
саккадические движения глаз представляют собой скачкообразный перенос взора на 
цель. Если саккада не приводит к попаданию цели в область фовеа, генерируется коррек- 
тирующая саккада, совмещающая цель с областью наилучшего видения в каждом из глаз. 
При перемещении цели в пространстве серия саккад выполняет функцию обратной свя- 
зи, смещая проекцию цели в область фовеа, тем самым реализует слежение за целью [3]. 

Здесь необходимо заметить: управление саккадами глаз, движением головы, целе- 
направленными движениями рук, голосовых связок и пр. движениями, осуществляется по 
сигналам цепочек командных нейронов, управляющих соответствующими перемеще- 
ниями. При этом состояние цепочек командных нейронов запоминается (с помощью 
образования и укрепления новых связей между нейронами в нейросети) в процессе 
слежения за целью, при неоднократном повторении этих процессов в дальнейшем, 
позволяет прогнозировать перемещение цели, движений рук или иных изменений рецеп- 
тивных полей в той или иной ситуации. Например, зная силу удара по мячу, мы свободно 
прогнозируем траекторию его полета и места приземления. Аналогично, общаясь с 
другом детства, членами семьи, коллегой, мы можем прогнозировать, о чем будет гово- 
рить тот или иной человек в той или иной обстановке. 

Итак, при восприятии объекты сканируется движением глаз, и их изображение 
преобразуется в контурное. 

На рис. 4 и 5 изображены фотографии головы Нефертити и девочки, а рядом записи 
движений глаз при свободном рассматривании фотографий. Оказывается, что взгляд 
движется по контуру объекта, при этом, наибольшее количество остановок и повтор- 
ных возвращений в тех местах контура, где больше всего тональных градаций, так 
как эти градации, вернее, их контраст и расположение, несут основную информацию 
о форме и фактуре объекта. 
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Рисунок 4 — Запись движений глаз 
при свободном рассматривании 
фотографии скульптурного портрета 
Нефертити в течение двух минут 
(Ярбус, 1965) 


Рисунок 5 — Запись движений глаз 
при свободном рассматривании 
фотографии девочки в течение трех 
минут (Ярбус, 1965) 


Из вышеизложенного можно сделать вывод, что для распознавания лучше то 
изображение, которое имеет наибольшее количество тональных градаций, то, у которого 
наиболее четкий контур. Поэтому система преобразования тонального изображения 
в контурное имеет важное значение. 

В биологических объектах первичная обработка информации осуществляется в 
сетчатке глаза на шести уровнях (рис. 6). Первый уровень — пигментный эпителий 
сетчатки. Второй уровень — палочки и колбочки. Третий уровень — горизонтальные 
клетки. Четвертый уровень — амакринные клетки. Пятый уровень — биполярные 
клетки. Шестой уровень — ганглиозные клетки. 
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Рисунок 6 — Срез сетчатки глаза 
и его схематическое представление 


В целом, с некоторыми упрощениями, назначение каждого уровня понятно. Пер- 
ВЫЙ И второй уровни — пигментный эпителий, палочки и колбочки — рецепторы 
восприятия видеоинформации. Палочки и колбочки не находятся в прямом контакте 
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с корой головного мозга, они контактируют с биполярными клетками, которые потом 
отправляют свои сообщения ганглиозным клеткам, аксоны которых составляют опти- 
ческий нерв. 

Третий уровень — горизонтальные клетки передают сообщения туда и обратно 
между клетками фоторецепторов, биполярным клеткам и друг другу. Горизонталь- 
ные клетки путем латерального торможения в окружающих областях останавливают 
диффузное распространение сигнала по сетчатке, которое могло бы возникнуть в связи 
с наличием широкого ветвления дендритов и аксонов в слоях сетчатки. Это важно для 
четкого выделения контрастных границ в зрительном образе. Четвертый уровень — 
амакринные клетки взаимосвязаны с биполярными клетками, ганглиозными клетками, 
а также друг с другом. Амакринные клетки располагаются во внутреннем зернистом 
слое сетчатки глаза, в плоскости внутреннего синаптического слоя сетчатки. Они обра- 
зуют чрезвычайно сложную, соединенную щелевыми контактами сеть, а отросток, не 
покидая пределов сетчатки, ветвится в области синаптических контактов биполярных 
ганглиозных нейронов, они изменяют характер распространения возбуждения по нерв- 
ным клеткам ганглиозного слоя. Число этих клеток особенно велико у животных с вы- 
сокой остротой зрения, например, у птиц. 

Третий и четвертый уровни играют важную роль в обработке визуальной инфор- 
мации на уровне сетчатки перед тем, как она передаются в мозг для конечной интер- 
претации и служат для повышения соотношения «чувствительность — детализация». 
Чем больше рецепторов присоединено к одной ганглиозной клетке, тем чувствительнее 
система, т.е. тем более слабые световые сигналы она сможет обнаружить (рис. 7). 
Сигнал на выходе ганглиозной клетки (острота зрения) будет тем сильнее, чем больше 
рецепторов к ней присоединено. При этом понятно, что повышение чувствитель- 
ности приводит к потере детализации. Таким образом, третий и четвертый уровни 
обеспечивают чувствительность, четкость и контрастность воспринимаемого изображеия. 
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Рисунок 7 — Рецепторы 
сетчатки глаза 


Пятый уровень — биполярные клетки являются клетками промежуточного слоя 
сетчатки, передающие нервные импульсы от рецепторов ганглиозным клеткам. Шестой 
уровень — ганглиозные клетки очень разнообразны по характеру ветвления дендритов. 
Они расположены в сетчатке очень плотно, и их дендритные поля (рецептивные поля) 
перекрываются. На одну ганглионарную клетку может конвергировать (замыкаться) 
от одного до сотни биполярных нейронов. Через биполярные нейроны с одной ганглио- 
нарной клеткой может быть связано от единиц до десятков тысяч фоторецепторов 
(палочек и колбочек). В свою очередь, один фоторецептор через биполярные нейроны 
может быть связан с десятками ганглиозных клеток. Ганглиозные клетки завершают 
«трёхнейронную рецепторно-проводящую систему сетчатки»: фоторецептор — биполяр- 
ный нейрон — ганглиозная клетка [4]. 
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Аппаратно-нейронная модель сенсорного органа 
зрительной системы человека 


Часть функций зрительной системы (первый, второй уровни) берут на себя видео- 
камеры, которые, как правило, используются в системах распознавания объектов. 
Третий — шестой уровни моделируются нейронной сетью. Полученное с видеокамеры 
тональное изображение объекта преобразуется в контурное, что позволяет значительно 
сократить объем необходимой для классификации информации. 

Задача выделения контуров на изображении уже давно решается классическими 
алгоритмами. Среди них пространственное дифференцирование, функциональная ап- 
проксимация, высокочастотная фильтрация. Общим для всех этих методов есть стрем- 
ление рассматривать границу как область резкого перепада функции яркости изобра- 
жения. Основной недостаток этих алгоритмов — относительно низкая скорость работы, 
которой будет недостаточно для обработки изображений большого размера при высокой 
частоте их поступления в реальном времени. 

Поэтому для выделения контуров изображения применен бионический подход, 
в котором обработка информации производится посредством нейронной сети. Такая 
сеть состоит из трех видов клеток, которые являются аналогом горизонтальных, 
биполярных и ганглиозных клеток (рис. 8). При физической реализации информация 
в сети обрабатывается на всех уровнях параллельно. В результате ожидается повы- 
шение быстродействия системы на несколько порядков. 
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Рисунок 8 — Модель сенсорного органа зрительной 
системы человека (объемное представление) 


На рис. 9 показана упрощенная схема модели сенсорного органа зрительной сис- 
темы человека. Сигналы от соответствующего рецептора или групп рецепторов через 
горизонтальные клетки (на схеме не показаны) поступают на дендриты биполярной 
и ганглиозных клеток, усиливаясь положительным весовым коэффициентом централь- 
ного дендрита, а сигналы, соответствующие соседним точкам изображения, тормо- 
зятся отрицательными весовыми коэффициентами боковых дендритов. Поступая 
в ганглиозную клетку, умноженные на соответствующие весовые коэффициенты, 
сигналы суммируются и подаются на выход. На выходе нейронной сети получается 
последовательность чисел, которые отвечают по определенному закону значениям 
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кодов цветов входных точек изображения. Полученные на выходе данные изображены 
в виде графика. На графике видны резкие перепады полученной функции, совпадающие 
с резкими сменами цвета. Зафиксировав эти перепады, сравниваем их размер с задан- 
ным порогом. Превышение размера порога свидетельствует о наличии точки, принад- 
лежащей контуру изображения. 
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Рисунок 9 — Модель сенсорного органа зрительной системы человека 
(упрощенное представление) 


Реализация модели сенсорного органа зрительной 
системы человека 


Для проверки работы модели была создана система выделения контуров изо- 
бражений. Благодаря полному параллелизму обработки каждой точки изображения, 
при аппаратной реализации этого подхода будет достигаться достаточно высокое 
быстродействие обработки в реальном времени входных теле- и видеоизображений. 
Итак, в бионическом подходе считается, что каждая точка или условная группа 
точек, воспринимаемого глазом изображения, отвечает одному нейрону (ганглиозной 
клетке). Каждый такой нейрон имеет несколько дендритов, которые через биполярные 
клетки связаны отрицательными связями с соседними нейронами. Уровень возбуждения 
нейронов фактически соответствует качеству контура. В системе реализована гибкая 
система настройки параметров виделения контура: изменение размера матрицы весовых 
коэффициентов; гибкая настройка пороговых значений; комбинирование разных ме- 
тодов сканирования изображения; сохранение параметров настройки. Полученный кон- 
тур при оптимальной настройке системы показан на рис. 10. 

Таким образом, светочувствительные рецепторы преобразуют световой поток в 
нервные возбуждения (сигналы). Вот тут-то и возникают основные проблемы пони- 
мания функционирования зрительной системы: каким образом из сигналов, посылаемых 
по зрительным нервам, в неокортексе формируются образы, воспринимаемые зрением. 

Наиболее вероятной моделью распознавания образов в высших слоях мозга чело- 
века является модель сравнения с эталоном. Это наиболее простой из всех способов 
распознавания образов. Распознавание осуществляется сравнением внешнего изображе- 
ния с набором внутренних эталонов. 


«Штучний 1нтелект» 42011 33 


Шевченко А.И., Ященко В.А. 


Рисунок 10 — Выделение контуров изображения 


Рабочая гипотеза 2. Гипотеза о механизме распознавания образов в высших 
слоях неокортекса мозга человека. Механизмом распознавания образов в высших 
слоях неокортекса мозга человека является модель сравнения с эталоном. Данная мо- 
дель обладает тем достоинством, что внешний образ сравнивается со всеми возмож- 
ными эталонами одновременно. В процессе сравнения одновременно активируется 
некоторая часть эталонов, и тот, который реагирует на данный образ наиболее 
активно, и есть искомый объект. 

В то же время, модель имеет существенный недостаток, связанный с тем, что 
при изменении освещения, ориентации или размеров внешнего образа относительно 
эталона распознавания не произойдет. Эталон — внутреннее представление образа 
распознаваемого объекта, запомненного ранее в различных положениях. Следовательно, 
если распознаваемое изображение объекта приводить к стандартному освещению, раз- 
меру и точно совмещать с эталоном, то модель работает безукоризненно. Учитывая, 
что при зрительном восприятии и концентрации внимания на объекте, видеоинформация 
проецируется в центральную ямку сетчатки. При этом изображение приводится к стан- 
дартной освещенности, стандартному размеру центральной ямки глаза, кроме того, 
осуществляется сканирование изображения с целью выявления наиболее информативных 
областей и возможно фиксации и сравнение расстояний между ними, то можно уверен- 
но предположить, что зрительная система использует модель сравнения с эталоном. 

Итак, мы считаем, что метод сравнения с эталоном активно применяется зри- 
тельной системой человека. В пользу этого предположения также свидетельствует и тот 
факт, что при рассмотрении (распознавании) изображения, например, очень сильно 
искаженной или перевернутой буквы или другого образа, встречающегося впервые, мы 
его долго, с разных сторон, под разными углами зрения крутим в руках. Но если мы 
узнали этот образ, то всегда в дальнейшем узнаем его легко, т.е. можно предположить, 
что искаженный образ сформировал новый эталон или был найден близкий эталон и 
зафиксированы связи, отвечающие за распознавание искаженного образа. Конечно, процесс 
обработки информации в слоях неокортекса не сводится только к сравнению объекта с 
эталоном. Этот процесс значительно сложнее. В нем на различных уровнях биологи- 
ческой нейронной сети, а в нашем случае — нейроподобной рецепторно-эффекторной 
растущей сети, осуществляется обработка, анализ, синтез и сравнение информации, но 
это уже относится к другой теме и является предметом другой статьи. 

Модель сенсорного органа зрительной системы человека совместно с методоло- 
гией обработки информации в рецепторно-эффекторных нейроподобных растущих се- 
тях [6-8] положена в основу разработки программного виртуального робота «УГТКОМ». 


Выводы 


В результате изучения существующей нейрофизиологической литературы сфор- 
мулированы гипотезы «О приведении распознаваемых изображений к одному размеру в 
области фовеа» и «О механизме распознавания образов в высших слоях неокортекса 
мозга человека». На базе рабочих гипотез созданы и реализованы модель и нейрон- 
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ная сеть сенсорного органа зрительной системы человека, подтвердившие правомерность 
гипотез. Модель сенсорного органа зрительной системы человека совместно с мето- 
дологией обработки информации в рецепторно-эффекторных нейроподобных растущих 
сетях положена в основу разработки программного виртуального робота «УТТКОМ». 
При аппаратной реализации информация в рецепторно-эффекторных нейроподобных 
растущих сетях обрабатывается параллельно на всех уровнях сети. В результате ожи- 
дается повышение быстродействия системы на несколько порядков. 

Первые версии аппаратно-программного комплекса -— виртуальный робот 
«УГТВОМ» успешно демонстрировались на выставках в Пекине (2000 г.), в Гановере 
на выставках СеВТ (2000 - 2002), в павильонах ВДНХ Украины (2000 - 2004 гг). 
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